********************************************************************************
*																		       *
* 							VAP								 				   *
*								     									       *
********************************************************************************

* -----> This do-file: Table A26

********************************************************************************

set more off
clear all
set matsize 3000
set maxvar 10000
************************************
* Path 
if "`c(username)'"=="Juan S. Morales" | "`c(username)'"=="jmorales" {
	global PathData = "C:/Users/`c(username)'/Dropbox/adamowicz/4_Draft/CPS_FINAL_submission/Data/"
	global PathFig = "C:/Users/`c(username)'/Dropbox/adamowicz/4_Draft/CPS_FINAL_submission/Figures/"
	global PathTab = "C:/Users/`c(username)'/Dropbox/adamowicz/4_Draft/CPS_FINAL_submission/Tables/"
	}
else { 
	global PathData = "/Users/JNG/Dropbox/adamowicz/4_Draft/CPS_FINAL_submission/Data/"
	global PathFig = "/Users/JNG/Dropbox/adamowicz/4_Draft/CPS_FINAL_submission/Figures/"
	global PathTab = "/Users/JNG/Dropbox/adamowicz/4_Draft/CPS_FINAL_submission/Tables/"
	} 

use "${PathData}\news_final.dta"

preserve
keep if neutral

txttool text, replace stopwords(${PathData}\polishstopwords.txt) stem
ngram text, degree(1) threshold(100) binarize

foreach varn in  t_adamowicz t_adamowicza t_andrzej t_aplikacji t_b t_bd t_bdzie t_bdziemi t_bezpieczestwa t_bya t_byi t_byo t_celu t_centrum t_chc t_chce t_chodzi t_chwili t_cz t_cza t_czasi t_czasu t_czci t_czwartek t_czym t_czynnoci t_decyzj t_decyzji t_dni t_dnia t_doda t_dodaa t_domu t_doszo t_dotyczc t_dotyczi t_drugi t_ds t_dwch t_dyrektor t_dzi t_dziaa t_dziaalnoci t_dziaania t_dzie t_dzieci t_dziki t_e t_ebi t_europejskiej t_finau t_funkcjonariusz t_gdaska t_gdasku t_godz t_godzin t_godzini t_grozi t_grudnia t_grupi t_informacj t_informacji t_informuj t_j t_jarosaw t_jednego t_jednej t_jednoczeni t_jednym t_jeeli t_jeli t_jestemi t_ju t_kadi t_kar t_kilku t_kolei t_kolejn t_komendi t_komisji t_komunikaci t_konferencji t_koniec t_kontroli t_kraju t_ktr t_ktra t_ktre t_ktrego t_ktrej t_ktry t_ktrych t_ktrym t_ktrzy t_lata t_latach t_latek t_ledztwa t_ledztwo t_letni t_letniego t_ludzi t_maj t_mami t_mczyzn t_mczyzna t_mediach t_mg t_mia t_miaa t_miai t_miao t_miasta t_midzi t_mie t_miejsc t_miejsca t_miejscu t_mierci t_miesic t_miesici t_mieszkacw t_min t_minist t_ministra t_mln t_moe t_mog t_moliwoci t_mona t_mwi t_mwia t_nalei t_napisa t_nastpni t_new t_ni t_niedziel t_nienawici t_noci t_noem t_now t_np t_obecni t_oceni t_ochroni t_ok t_okazao t_okoo t_okrgowej t_opini t_organizacji t_osb t_osob t_osoba t_osobi t_owiadczi t_p t_partii t_pastwa t_paw t_pawa t_pi t_pierwsz t_pierwszi t_piotr t_pitek t_pniej t_pocztku t_poda t_podkr t_podkrelia t_podstawi t_poinformowa t_poinformowaa t_policj t_policja t_policji t_polityk t_polsat t_polsc t_polsk t_polska t_polski t_polskich t_polskiego t_polskiej t_pomoc t_pomoci t_ponadto t_poniedziaek t_poniewa t_postpowani t_postpowania t_poudniu t_powiedzi t_powiedzia t_powiedziaa t_powodu t_pozbawienia t_prac t_praci t_pracownikw t_prasowej t_prasowi t_prawa t_prawo t_premier t_premiera t_preze t_prezesa t_prezyd t_prezydenta t_prezydentem t_proc t_programi t_projekt t_prokur t_prokuratura t_prokuraturi t_prowadzi t_przeciwko t_przedstawiciel t_przekaza t_przestpstwa t_przypadku t_przypomnia t_przyzna t_publicznej t_publicznych t_pytani t_r t_radi t_ramach t_rano t_raz t_razem t_razi t_red t_rnych t_rod t_rodkw t_rodzin t_rodzini t_rok t_rozmowi t_rwnie t_rzdu t_rzecz t_rzeczniczka t_rzecznik t_scen t_sd t_sdu t_si t_sobot t_sowa t_sposb t_spotkania t_spraw t_sprawa t_sprawdna t_sprawi t_sprawiedliwoci t_stan t_stani t_stanu t_stefana t_stroni t_stwierdzi t_stycznia t_subi t_swoich t_swoim t_swoj t_swojego t_swojej t_sytuacj t_sytuacja t_sytuacji t_szef t_szefa t_szpitala t_take t_takich t_takiej t_telefon t_temat t_temu t_tereni t_trafi t_trakci t_trzech t_trzy t_twitterz t_twj t_ty t_tzw t_udao t_udzia t_ul t_urzdu t_ustal t_ustawi t_uwag t_wadz t_wani t_warszawi t_wczeniej t_wedug t_wic t_wicej t_wieczorem t_wielkiej t_wizienia t_wniosek t_wobec t_woj t_wolnoci t_wop t_wraz t_wrd t_ws t_wskaza t_wtorek t_wwcza t_wyjani t_wyjania t_wynika t_wyniku t_wysokoci t_wzgldu t_ycia t_ycie t_zakresi t_zapewni t_zapowiedzia t_zarwno t_zarzut t_zarzuti t_zatrzymani t_zaznaczi t_zdaniem t_zdarzenia t_zdrowia t_zgodni t_zmar t_zmiani t_zoi t_zosta t_zostaa t_zostai t_zostani t_zostao t_zrobi t_zwizku t_zwrci {
	egen S_`varn' = sum(`varn')
}


keep in 1
keep S_*
br

restore


preserve
keep if progov

txttool text, replace stopwords(${PathData}\polishstopwords.txt) stem
ngram text, degree(1) threshold(50) binarize

foreach varn in t_adamowicz t_adamowicza t_andrzej t_ataku t_b t_bd t_bdzie t_bdziemi t_bezpieczestwa t_biura t_bya t_byego t_byi t_byo t_cai t_celu t_centrum t_charakterz t_chc t_chce t_chodzi t_chwili t_cigu t_cz t_cza t_czasi t_czasu t_czci t_czteri t_czwartek t_czym t_czynnoci t_decyzj t_decyzji t_dni t_dnia t_doda t_dodaa t_dopiero t_doszo t_dotyczc t_dotyczi t_ds t_duda t_dwch t_dyrektor t_dzi t_dziaa t_dziaalnoci t_dziaania t_dzie t_dzieci t_dziki t_e t_ebi t_europejskiej t_finau t_funkcjonariusz t_gazeta t_gdaska t_gdasku t_godz t_grozi t_grudnia t_grupi t_informacj t_informacji t_informuj t_j t_jarosaw t_jednego t_jednej t_jednoczeni t_jednym t_jeeli t_jeli t_ju t_kadi t_kar t_kilku t_kolei t_kolejn t_komisji t_konferencji t_koniec t_kontroli t_krajowej t_kraju t_krzysztof t_ktr t_ktra t_ktre t_ktrego t_ktrej t_ktry t_ktrych t_ktrym t_ktrzy t_lata t_latach t_ledczi t_ledztwa t_ledztwo t_letni t_letniego t_ludzi t_lutego t_maj t_mami t_mateusz t_mczyzn t_mczyzna t_media t_mia t_miaa t_miai t_miao t_miasta t_midzi t_mie t_miejsc t_miejsca t_miejscu t_mieli t_mierci t_miesic t_miesici t_min t_minist t_ministra t_mln t_moe t_mog t_moliwoci t_mona t_morawiecki t_mwi t_nadziej t_najmniej t_nalei t_napisa t_nasw t_ni t_niedziel t_nienawici t_noci t_noem t_np t_obecni t_obroni t_oceni t_ochroni t_ok t_okoo t_okrgowej t_osb t_osob t_osoba t_osobi t_ostatni t_ostatnich t_p t_partii t_pastwa t_paw t_pawa t_pi t_pierwsz t_pierwszi t_piotr t_pitek t_platformi t_pniej t_pocztku t_poda t_podaj t_podkr t_poinformowa t_poinformowaa t_polakw t_policj t_policja t_policji t_polityk t_politykw t_polsc t_polsk t_polska t_polski t_polskich t_polskiego t_polskiej t_polub t_pomoc t_pomoci t_poniedziaek t_poniewa t_poowi t_portal t_pose t_postpowania t_poudniu t_powiedzi t_powiedzia t_powiedziaa t_powodu t_pozbawienia t_prac t_praci t_pracownikw t_prawa t_prawo t_premier t_premiera t_preze t_prezesa t_prezyd t_prezydenta t_proc t_proce t_program t_programu t_prokur t_prokuratura t_prokuraturi t_prowadzi t_przeciwko t_przestpstwa t_przypadku t_przypomnia t_przyzna t_publicznej t_pytani t_r t_radi t_ramach t_rano t_raz t_razem t_razi t_rod t_rodzin t_rodzini t_rok t_rozmowi t_rp t_rwnie t_rzdu t_rzecz t_rzeczniczka t_rzecznik t_scen t_sd t_sdu t_si t_siebi t_sobot t_sowa t_sposb t_spraw t_sprawa t_sprawi t_sprawiedliwoci t_stan t_stani t_stefan t_stefana t_stroni t_stwierdzi t_stycznia t_subi t_swoich t_swoim t_swoj t_sytuacji t_szef t_szefa t_szpitala t_take t_takich t_temat t_temu t_tereni t_tomasz t_trafi t_trakci t_trzech t_trzy t_tvp t_tvpinfo t_twitterz t_ty t_tzw t_udao t_udzia t_ul t_ustal t_ustawi t_uwag t_wadz t_wani t_warszawi t_wartoci t_wczeniej t_wedug t_wiadomo t_wic t_wicej t_wieczorem t_wielkiej t_wieszwiecej t_wieszwiecejpolub t_wizienia t_wniosek t_wobec t_wolnoci t_wop t_wraz t_wrd t_wskaza t_wtargn t_wtorek t_wwcza t_wyborach t_wyborczej t_wyjani t_wyjania t_wynika t_wyniku t_wyrok t_wysokoci t_wzgldu t_ycia t_ycie t_zabjstwa t_zakresi t_zapewni t_zarzut t_zarzuti t_zatrzymani t_zaznaczi t_zdaniem t_zdarzenia t_zdrowia t_zgodni t_zmar t_zoi t_zosta t_zostaa t_zostai t_zostani t_zostao t_zotych t_zrobi t_zwizku t_zwrci {
	egen S_`varn' = sum(`varn')
}

keep in 1
keep S_*

restore

preserve
keep if proopp

txttool text, replace stopwords(${PathData}\polishstopwords.txt) stem
ngram text, degree(1) threshold(100) binarize

foreach varn in t_adamowicz t_adamowicza t_andrzej t_andrzeja t_apeluj t_aresztu t_art t_artykuw t_ataku t_auto t_autorskim t_b t_batyckiej t_bd t_bdzie t_bdziemi t_bezpieczestwa t_biedronia t_bispl t_bocianim t_broni t_burz t_bya t_byi t_byo t_c t_ca t_cai t_caym t_celem t_celsjusza t_centrum t_chce t_chcia t_chcielibyci t_chodzi t_chwili t_chyba t_ciao t_ciek t_cigu t_copyright t_cz t_cza t_czasi t_czasu t_czci t_czego t_czekami t_czerwonego t_czerwoni t_czowiek t_czowieka t_czwartek t_czym t_czynnoci t_czytaj t_czytajdalej t_da t_dalej t_dalsz t_dane t_decyzj t_deszczu t_dni t_dnia t_dniach t_dobr t_doda t_dodaa t_dodaj t_domu t_doradca t_doskonal t_doszo t_dotyczc t_dowiedzia t_drodz t_drogi t_drugi t_dudi t_duo t_dwch t_dwjk t_dynamicznej t_dyskotek t_dzi t_dziaa t_dziaania t_dzie t_dzieci t_dziwni t_dziwnowi t_e t_ebi t_eglugi t_europejskiej t_fina t_finau t_funduj t_gdask t_gdaska t_gdasku t_gniazdem t_go t_godzin t_godzini t_godzinnego t_gospodarki t_grozi t_grudnia t_grzegorza t_gwny t_head t_imi t_informacj t_informacji t_informuj t_innymi t_instytut t_intensywnymi t_internetowej t_internetowych t_j t_jacek t_jadci t_jaka t_jarosaw t_jednego t_jednej t_jednym t_jeeli t_jeli t_jestemi t_ju t_k t_kadi t_kamienica t_kampani t_kierowca t_kierownictwo t_kobieta t_kogo t_konferencji t_koniec t_konstytucyjnego t_korzystani t_koszt t_krajowych t_kraju t_krtk t_krzysztof t_ktr t_ktra t_ktre t_ktrego t_ktrej t_ktry t_ktrych t_ktrym t_ktrzy t_kupi t_kwietnia t_kwot t_lata t_latach t_latek t_latka t_letni t_letniego t_licencyjnej t_liczbi t_lotu t_lotw t_ludzi t_maj t_majc t_maksymalni t_mami t_marek t_materiaw t_mateusz t_mczyzn t_mczyzna t_media t_meteorologii t_mg t_mia t_miaa t_miao t_miasta t_micha t_midzi t_mie t_miejsc t_miejscami t_miejscu t_mieli t_mierci t_miesic t_miesici t_mieszkaci t_min t_minist t_miszek t_moe t_moemi t_mog t_mogli t_momenci t_mona t_morawiecki t_musz t_mwi t_mwia t_myl t_n t_nadali t_nadziej t_najbardziej t_najbliszych t_najpierw t_nakontakt t_nalei t_napisa t_naprawd t_nastpi t_ni t_niebezpiecznymi t_niedziel t_nienawici t_nieoficjalnych t_niesteti t_nikt t_noci t_noem t_notowania t_o t_obecni t_obroni t_obywatelskich t_obywatelskiej t_oceni t_ochroni t_odchodzi t_odjecha t_odni t_odpowiedzialni t_ogldaj t_okoo t_opadi t_opni t_opowiada t_opublikowano t_organizacji t_orkiestri t_osb t_osoba t_osobi t_ostatni t_ostrzega t_partii t_pasaerskosamochodowego t_pastwa t_pastwo t_paw t_pawa t_peen t_pewno t_pewnym t_pi t_pienidz t_pierwszi t_pierwszym t_pieszych t_piotr t_piszci t_pitek t_pkt t_pl t_plai t_platformi t_pniej t_pocztku t_podj t_podkr t_podkrela t_podstawi t_pogodi t_pogodowymi t_poinformowa t_poinformowaa t_pojawi t_poka t_pokrewnych t_pokrywa t_polaci t_policj t_policja t_policjantw t_policji t_polityci t_polityk t_politykw t_polsc t_polsk t_polska t_polski t_polskiego t_polskiej t_pomoci t_pomorskiem t_poniedziaek t_poniewa t_popada t_pose t_postpowania t_potem t_poudniu t_powiedzi t_powiedzia t_powiedziaa t_powiej t_powodu t_prac t_praci t_praw t_prawa t_prawach t_prawidowo t_prawo t_premier t_preze t_prezesa t_prezyd t_prezydenta t_prezydentem t_proczu t_programach t_projektowaniu t_prokuratura t_prokuraturi t_promu t_prostu t_prowadzi t_przechodz t_przeci t_przeciwko t_przedstawi t_przejci t_przekaza t_przekazuj t_przelotn t_przemoci t_przestpstw t_przestpstwa t_przyczyn t_przypadku t_przyzna t_publicznej t_pytani t_r t_radi t_ran t_rano t_raz t_razem t_razi t_rdo t_red t_redakcyjnych t_regionem t_rnych t_roberta t_robi t_rod t_rodzina t_rodzini t_rowerow t_rozmawia t_rozmowi t_rozpowszechniani t_rozwi t_rwnie t_rzdowym t_rzdu t_rzecz t_rzeczniczka t_rzecznik t_rzeszowa t_sa t_samochd t_sceni t_schetyni t_sd t_sdu t_senatu t_serca t_si t_siebi t_siedzibi t_skali t_sobot t_solidarnoci t_sowa t_sp t_spaceru t_spodziewa t_sposb t_spotkani t_spotkania t_spraw t_sprawi t_sprawiedliwoci t_sta t_stan t_stani t_stao t_statusi t_statystyczni t_stefan t_stopni t_stosownej t_stou t_straci t_stronach t_stroni t_stwierdzi t_stycznia t_suba t_swoich t_swoim t_swoj t_swojego t_swojej t_sygnaymateriai t_syska t_sytuacja t_sytuacji t_szeciolatki t_szef t_sznurek t_szpitala t_szpitalu t_szyi t_take t_takich t_takiego t_takim t_telefoni t_temat t_tematem t_temu t_termometri t_torowisko t_trafi t_trakci t_trudno t_trwa t_trybunau t_trzech t_trzy t_tumaczi t_tvn t_tvnpl t_twitterz t_tyle t_tysici t_udao t_uderzi t_udzia t_ugrupowania t_umowi t_upalni t_urzd t_usiad t_ust t_ustawi t_usysza t_uwag t_wadz t_wane t_wani t_warszawi t_wartoci t_waszym t_wci t_wczeniej t_wczeniejszej t_wedug t_wiadomo t_wiata t_wic t_wicej t_wida t_wideo t_wie t_wieci t_wieczorem t_wielka t_wielki t_wielkiej t_wiem t_wiemi t_wiosni t_witecznej t_wizienia t_wniosek t_wobec t_wodnej t_wolno t_wolnoci t_wop t_wpatrzeni t_wrd t_wsi t_wskaza t_wskazuj t_wtorek t_wyborach t_wyborcz t_wyglda t_wyjani t_wyjania t_wykaz t_wymaga t_wynika t_wyniku t_wyrani t_wysokoci t_ycia t_ycie t_yka t_zaatakowa t_zabjstwa t_zabra t_zabronion t_zachodniopomorski t_zacz t_zaczam t_zadanych t_zagranicznych t_zagrzmi t_zainteresowa t_zamieszczonych t_zanadrzu t_zaopiekowaa t_zaparkowan t_zarzut t_zarzuti t_zaskareni t_zastrzega t_zatrzymani t_zauwaaj t_zauwai t_zauwayam t_zauwayli t_zawarcia t_zawieszona t_zaznaczi t_zdaniem t_zdarzenia t_zdecydowalimi t_zdrowia t_zebrao t_zgodi t_zgodni t_zjawiskami t_zmar t_zmian t_znale t_zobacz t_zosta t_zostaa t_zostai t_zostani t_zostao t_zotych t_zrobi t_zwizanym t_zwizku t_zwrci {
	egen S_`varn' = sum(`varn')
}

keep in 1
keep S_*

restore


preserve
keep if neutral

txttool title, replace stopwords(${PathData}\polishstopwords.txt) stem
ngram title, degree(1) threshold(10) binarize

foreach varn in t_adamowicza t_akt t_apeluj t_areszt t_aresztu t_ataku t_b t_bd t_bdzie t_byi t_byo t_cba t_chce t_domu t_dot t_dulkiewicz t_dwch t_dzieci t_dzikw t_e t_escap t_gdaska t_gdasku t_grozi t_imgw t_j t_ju t_kaczyskiego t_kierowca t_knf t_komisja t_kopalni t_krakw t_ktry t_latek t_latka t_ledztwo t_letni t_mczyzna t_mia t_miaa t_mierci t_min t_minist t_mln t_moe t_mon t_morawiecki t_nauczyci t_nbp t_niegu t_nienawici t_nik t_now t_osb t_oskarenia t_osobi t_p t_pawa t_pi t_poar t_policj t_policja t_polsc t_polska t_polski t_premier t_premiera t_preze t_prezesa t_prezyd t_prezydenta t_proce t_projekt t_prokuratura t_przeciw t_przeciwko t_przestpstwa t_r t_razem t_roomi t_ruszi t_sd t_si t_spotka t_sprawi t_stefan t_stefana t_szef t_szpitalu t_trafi t_trzy t_ty t_ustawi t_vat t_warszawi t_wizienia t_wniosek t_wobec t_wop t_ws t_wypadek t_wyrok t_yje t_zabjstwa t_zarzuti t_zatrzymani t_zosta t_zwizku {
	egen S_`varn' = sum(`varn')
}


keep in 1
keep S_*
br

restore


preserve
keep if progov

txttool title, replace stopwords(${PathData}\polishstopwords.txt) stem
ngram title, degree(1) threshold(8) binarize

foreach varn in  t_adamowicza t_areszt t_ataku t_bd t_bdquoalarmrdquo t_bdzie t_byi t_byo t_cba t_chce t_dzieci t_dzikoacutew t_e t_escap t_gdaska t_gdasku t_grozi t_koszalini t_ktoacuteri t_ledczi t_mczyzna t_mierci t_minist t_moe t_nbp t_nienawici t_ochroni t_opinia t_osoacuteb t_osobi t_paacu t_pawa t_pi t_poar t_policja t_polsc t_polski t_premier t_preze t_prezyd t_prezydenta t_projekt t_prokuratura t_psl t_rzecznik t_sd t_si t_sprawa t_sprawi t_stefan t_stefana t_szef t_szefa t_temu t_tragedia t_trwa t_trzech t_trzy t_tvp t_ty t_wobec t_wop t_ws t_wyrok t_zarzuti t_zatrzymani t_zmar t_zosta {
	egen S_`varn' = sum(`varn')
}


keep in 1
keep S_*
br

restore



preserve
keep if proopp

txttool title, replace stopwords(${PathData}\polishstopwords.txt) stem
ngram title, degree(1) threshold(8) binarize

foreach varn in  t_adam t_adamowicz t_adamowicza t_andruszkiewicz t_andrzej t_areszt t_atak t_ataku t_bdzie t_byi t_cba t_chce t_duda t_dulkiewicz t_escap t_faktach t_gdask t_gdaska t_jacek t_jerzi t_kaczyski t_kaczyskiego t_kierowca t_komentarz t_konferencja t_kontrol t_koszalin t_ktry t_latek t_latka t_mia t_mierci t_morawiecki t_mowi t_nbp t_nienawici t_owsiak t_owsiaka t_paw t_pawa t_pi t_piotr t_poar t_pogrzeb t_policj t_policja t_polityci t_politykw t_polsc t_polska t_polski t_pozna t_premier t_premiera t_prezesa t_prezyd t_prezydenta t_proce t_projekt t_prokuratura t_roomi t_sd t_sdu t_sejmi t_si t_spotkani t_sprawi t_stefana t_szuka t_tami t_tvn t_ustawi t_wop t_wospwtvn t_ws t_wspomina t_wyborach t_wyrok t_yje t_zabjstwo t_zarzuti t_zatrzymani {
	egen S_`varn' = sum(`varn')
}


keep in 1
keep S_*
br

restore
